在过去的几十年中,出现了一种趋势,指出在可移动,可编程和可转换机制中利用结构不稳定性。受钢制发夹的启发,我们将面板组件与可靠的结构相结合,并使用半刚性塑料板建造合规的拍打机构,并将其安装在束缚的气动软机器人鱼和无螺旋螺旋式的电动机驱动器上,以展示它的前所未有的优势。设计规则是根据理论和验证提出的。观察到与参考相比,气动鱼的游泳速度提高了两倍,对Untether Fish的进一步研究表明,对于不固定的兼容的游泳运动员,可损坏的速度为2.03 BL/S(43.6 cm/s),优于先前报告的最快的,其幅度为194%。这项工作可能预示着下一代符合下一代机器人技术的结构革命。
translated by 谷歌翻译
Remote sensing imagery provides comprehensive views of the Earth, where different sensors collect complementary data at different spatial scales. Large, pretrained models are commonly finetuned with imagery that is heavily augmented to mimic different conditions and scales, with the resulting models used for various tasks with imagery from a range of spatial scales. Such models overlook scale-specific information in the data. In this paper, we present Scale-MAE, a pretraining method that explicitly learns relationships between data at different, known scales throughout the pretraining process. Scale-MAE pretrains a network by masking an input image at a known input scale, where the area of the Earth covered by the image determines the scale of the ViT positional encoding, not the image resolution. Scale-MAE encodes the masked image with a standard ViT backbone, and then decodes the masked image through a bandpass filter to reconstruct low/high frequency images at lower/higher scales. We find that tasking the network with reconstructing both low/high frequency images leads to robust multiscale representations for remote sensing imagery. Scale-MAE achieves an average of a $5.0\%$ non-parametric kNN classification improvement across eight remote sensing datasets compared to current state-of-the-art and obtains a $0.9$ mIoU to $3.8$ mIoU improvement on the SpaceNet building segmentation transfer task for a range of evaluation scales.
translated by 谷歌翻译
Datasets for training recommender systems are often subject to distribution shift induced by users' and recommenders' selection biases. In this paper, we study the impact of selection bias on datasets with different quantization. We then leverage two differently quantized datasets from different source distributions to mitigate distribution shift by applying the inverse probability scoring method from causal inference. Empirically, our approach gains significant performance improvement over single-dataset methods and alternative ways of combining two datasets.
translated by 谷歌翻译
本文分析了有限状态马尔可夫决策过程(MDPS),其不确定参数在紧凑的集合中,并通过基于集合的固定点理论从可靠的MDP产生重新检查。我们将Bellman和政策评估运营商概括为在价值功能空间合同的运营商,并将其表示为\ Emph {Value Operators}。我们将这些值运算符概括为在价值函数集的空间集上,并将其表示为\ emph {基于集合的值运算符}。我们证明,这些基于集合的价值运算符是紧凑型值函数集空间中的收缩。利用集合理论的洞察力,我们将Bellman运算符的矩形条件从经典稳健的MDP文献到\ emph {CONTAMENT条件}的矩形条件,用于通用价值操作员,该算法较弱,可以应用于较大的参数 - 不确定的MDPS集以及动态编程和强化学习中的承包运营商。我们证明,矩形条件和遏制条件都足够确保基于设定的值运算符的固定点集包含其自身的至高无上的元素。对于不确定的MDP参数的凸和紧凑型集,我们显示了经典的鲁棒值函数与基于集合的Bellman运算符的固定点集的最高点之间的等效性。在紧凑型集合中动态更改的MDP参数下,我们证明了值迭代的集合收敛结果,否则可能不会收敛到单个值函数。
translated by 谷歌翻译
随着越来越多的监控系统已部署到智能城市,因此,将新的人类指定要求转换为机器可靠的正式规格的需求更高。但是,这些特定于人类的要求通常以英语编写,并带来丢失,不准确或模棱两可的信息。在本文中,我们提出了CitySpec,这是一个智能城市中的智能助理系统。CitySpec不仅有助于克服英语要求和正式规格带来的语言差异,而且还为缺失,不准确或模棱两可的信息提供了解决方案。本文的目的是展示CitySpec的工作原理。具体而言,我们提出了三个演示:(1)CitySpec中需求的交互式完成;(2)CitySePC遇到例外的人类校正;(3)在城市范围内的在线学习。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
智能城市已经开发了越来越多的监视系统,以确保城市的实时操作满足安全性和绩效要求。但是,许多现有的城市要求是用英语编写的,缺少,不准确或模棱两可的信息。有很高的需求,可以协助城市政策制定者将人类指定的要求转换为用于监视系统的机器可理解的形式规格。为了应对这一限制,我们构建了CitySpec,这是第一个在智能城市进行需求规范的智能助理系统。为了创建CitySpec,我们首先收集来自100多个城市的不同领域的1,500多个现实世界的需求,并提取特定于城市的知识,以生成带有3,061个单词的城市词汇数据集。我们还构建了翻译模型并通过需求综合来增强它,并在不确定性下使用验证开发新颖的在线学习框架。现实世界中城市需求的评估结果表明,CitySpec将需求规范的句子级别的准确性从59.02%提高到86.64%,并且对新城市和新领域具有强大的适应性(例如,西雅图的F1分数提高了需求。通过在线学习从77.6%到93.75%)。
translated by 谷歌翻译
在这项工作中,我们介绍了一种新的长尾识别战略,通过无训练知识转移来解决尾课的几次射门问题。我们的目标是将从信息丰富的常见课程获得的知识转移到语义上类似,但数据饥饿的罕见课程,以获得更强的尾级陈述。我们利用类原型和学习余弦分类器在特征空间中提供两个不同,互补的类集群中心的不同互补表示,并使用注意机制从常见类别中选择和重新测试学习的分类器特征,以获得更高质量的珍稀类表示。我们的知识转移过程自由培训,减少过度风险,并可能够为新课程提供持续的分类器。实验表明,我们的方法可以在罕见的阶级提高显着的性能,同时保持稳健的普通类性能,优于直接可比的最先进模型。
translated by 谷歌翻译
内镜窦和头骨基础手术(Essbss)是一个具有挑战性和潜在的危险的外科手术,客观技能评估是提高手术训练有效性的关键组成部分,重新​​验证外科医生的技能,并降低手术创伤和并发症手术室的速度。由于外科手术的复杂性,操作风格的变化,以及新的外科技能的快速发展,外科技能评估仍然是一个具有挑战性的问题。这项工作提出了一种新颖的高斯过程学习的启发式自动客观外科手术技能评估方法。不同于经典的外科技能评估算法,所提出的方法1)利用外科仪器相对运动中的运动学特征,而不是使用特定的外科任务或统计数据实时评估技能; 2)提供信息丰富的反馈,而不是总结分数; 3)能够逐步从新数据逐步学习,而不是根据固定的数据集。该方法将仪器运动投射到内窥镜坐标中以减少数据维度。然后,它提取投影数据的运动学特征,并学习外科技能水平与高斯过程学习技术的特征之间的关系。该方法在全内镜颅底和尸体上的鼻窦手术中核实。这些手术具有不同的病理学,需要不同的治疗并具有不同的复杂性。实验结果表明,该方法达到了100 \%的预测精度,用于完整的外科手术和90 \%的实时预测评估精度。
translated by 谷歌翻译
互联网公司越来越多地使用机器学习模型来创建分配每个人的个性化政策,为每个人提供最佳预测的待遇。它们通常来自黑盒异质处理效果(HTE)模型,预测单个治疗效果。在本文中,我们专注于(1)HTE模型的学习解释;(2)学习规定待遇任务的可解释政策。我们还提出了指导树木,这一方法可以在没有解释性丧失的情况下集合多种可意识到的政策。这些基于规则的可解释策略很容易部署,避免需要在生产环境中维护HTE模型。
translated by 谷歌翻译